(網(wǎng)經(jīng)社訊)9月19日,2024云棲大會在杭州云棲小鎮(zhèn)開幕,此次大會以“云啟智躍,產(chǎn)業(yè)蝶變”為主題,吸引了眾多前沿技術(shù)企業(yè)展示AI時代云上創(chuàng)新的潮流科技。喜馬拉雅珠峰AI音頻多模態(tài)大模型亮相云棲大會。
在2024云棲大會上,喜馬拉雅展示了“珠峰AI音頻多模態(tài)大模型”的強(qiáng)大功能、應(yīng)用場景及商業(yè)化案例。據(jù)網(wǎng)經(jīng)社數(shù)字文娛臺(WY.100EC.CN)獲悉,“珠峰AI音頻多模態(tài)大模型”是喜馬拉雅自主研發(fā)的AI音頻生成大模型,依托其超百萬小時的自有版權(quán)音頻數(shù)據(jù)進(jìn)行深度學(xué)習(xí)與訓(xùn)練,具備情感輸出、自然表達(dá)、語種互譯、極速克隆等技術(shù)能力,并在音頻生成領(lǐng)域?qū)崿F(xiàn)了多維度突破,正廣泛應(yīng)用于有聲書等領(lǐng)域,未來將不斷推動音頻大模型行業(yè)的創(chuàng)新與發(fā)展。
數(shù)據(jù)顯示,2023年喜馬拉雅全場景平均月活躍用戶達(dá)3.03億。截至2023年12月,喜馬拉雅平臺AIGC內(nèi)容達(dá)2.4億分鐘,占其音頻內(nèi)容的6.6%。同時,喜馬拉雅移動端平均月活躍用戶的AIGC滲透率已達(dá)14.8%。據(jù)了解,喜馬拉雅音頻大模型具備“產(chǎn)模一體生態(tài)系統(tǒng)、持續(xù)進(jìn)化的生態(tài)飛輪”的模型優(yōu)勢,已廣泛應(yīng)用于內(nèi)容創(chuàng)作、數(shù)智分身、語音交互等場景,并已實(shí)現(xiàn)商業(yè)化。
在上海網(wǎng)信辦發(fā)布的最新一批上海市生成式大模型備案通過名單中,喜馬拉雅音頻大模型與米哈游、閱文集團(tuán)的筑夢島等文本大模型共同通過了備案,成為全國首個通過網(wǎng)信辦生成式人工智能服務(wù)的音頻生成類大模型。